Sesión 09

Uso de herramientas de aseguramiento y control

de calidad de datos


Percy Soto-Becerra, M.D., M.Sc(c)

DIS | IETSI, ESSalud

2023

Módulo de Calidad de Datos

Validación de Datos (quality checks)


Proceso de garantizar que los datos se hayan sometido a una “limpieza” para generar un conjunto de datos de alta calidad, correcto, coherente y aplicable.

  • Es un proceso continuo

  • Debe planificarse e implementarse antes de la recolección de datos:

    • aseguramiento de calidad
  • Debe realizarse desde el inicio y durante toda la recolección de datos:

    • control de calidad

Proceso de Validación de datos




Antes de iniciar la recolección de datos

¿Cuánto antes debo verificar la calidad?


  • Debo implementar el proceso de aseguramiento de calidad antes de pasar a producción el proyecto.

Aseguramiento de calidad previo pase a Producción


  • El pase a producción del proyecto es condición necesaria para recopilar datos reales.

  • IETSI controla este paso en dos puntos:

    • Verificar aseguramiento de calidad.
    • Verificar cumplimiento de estándares éticos y regulatorios.
  • La verificación de calidad de parte de IETSI no es tan estricta.

    • Confiamos en que saben lo que hacen (tengan cuidado!)
  • La verificación de cumpliemto de estándares éticos y regulatorios es muy estricta por parte de IETSI.

    • No confiamos en nadie hasta no verificarlo rigurosamente (tengan cuidado!)

¿Por qué antes y no después?


Objetivo

  • Diseñar el formato de recolección de datos que convenga al proyecto y asegure la calidad de los datos.

    • Diccionario de datos
    • Configuración del proyecto

Beneficio

  • Reduce el numero de inconvenientes durante la recolección de datos
  • Reduce la carga de apoyo de parte del Administrador de REDCap
  • Reduce el tiempo de limpieza de los datos
  • Permite obtener datos de altísima calidad
  • Veamos algunos ejemplos de problemas de calidad frecuentes (en nuestra experiencia) encontrados antes de iniciar la recolección de datos.

Ejemplo 1 Inconsistencias en codificación de alternativas recurrentes


  • El clásico ejemplo son las alternativas de Si/No

  • Otras alternativas recurentes también pueden ser escritas de manera no armonizada.

  • La herramienta de Copiar opciones existentes puede ayudar a reducir este error.

Uso de copiar opciones existentes para prevenir errores de codificación




Ejemplo 2 Formatos no asignados a eventos


  • En formularios longitudinales es importante que cada uno de ellos tenga un evento asignado.

    • Si no tiene evento asignado, el formulario no estará disponible.

Ejemplo 3 Errores en crear campos lógicos


  • Errores de cálculo
  • Errores en lógica de ramificación
  • Problemas con la cola de encuestas
  • Problemas con invitaciones a encuestas automatizadas

Ejemplo 4 ‘Testing’ insuficiente


  • Un problema común es que salen a recopilar datos apenas tienen la versión 1 del formulario.

    • Casi siempre van a encontrar problemas con los formularios en campo.
    • Editar los formularios en producción conlleva el riesgo de perder datos.
  • Aunque no hay reglas mágicas, recomendamos seguir los siguientes estándares mínimo de testing:

    • Haga al menos 3 pruebas con datos simulados (“fake”)
    • Al menos realice una exportación de datos
    • Revise su pizarra de registros!
    • Altamente recomendable: Revisar el proyecto conm un asesor/experto en datos antes de pasar al modo producción.

Pruebe su instrumento antes de pasar a modo produccion


Durante la recolección de datos (validación interna)

Buenas prácticas


  • Evitar campos con textos libres
  • Definir el tipo de variable de los datos
  • No mezcle diferentes tipos de datos en una casilla de respuesta
  • Usar las reglas de validación de REDCap
  • Reducir la cantidad de datos perdidos
  • Evitar espacios en blanco
  • Ser consistente a lo largo del estudio usando los mismos códigos
  • Configura tu base de datos con la estructura en mente

Durante la recolección de datos (validación externa)

  • Use la herramienta de calidad de datos de REDCap.

  • Esta viene con quality checks pre configurados.

  • También viene con un constructor de nuevos quality checks.

Encontrar discrepancias (quality checks)


Encontrar discrepancias (quality checks)


Encontrar discrepancias (quality checks)


Encontrar discrepancias (quality checks)


Solucionar discrepancias


  • Puedes solucionar discrepancia directamente.

  • O usar queries para que otra persona asignada los resuelva y documente su resolución.

    • Corregido - datos perdidos
    • Corregido - error de digitación
    • Corregido - error de fuente
    • Verificado - información correcta

¿Preguntas?

Hagamos una pausa


Tomemos un descanso de 5 minutos

Estire las piernas

Deje de ver las pantallas

… cualquier , las del celular también.

05:00